Mô hình markov là gì? Các bài nghiên cứu khoa học liên quan

Mô hình Markov là chuỗi biến ngẫu nhiên thỏa mãn tính chất memoryless, trong đó xác suất chuyển sang trạng thái tiếp theo chỉ phụ thuộc trạng thái hiện tại. Tính chất này cho phép tính phân phối trạm dừng dài hạn qua lũy thừa ma trận chuyển tiếp, từ đó dự báo xác suất trạng thái theo thời gian.

Giới thiệu

Mô hình Markov (Markov model) là công cụ toán học để mô tả và phân tích các quá trình ngẫu nhiên, trong đó xác suất chuyển từ trạng thái hiện tại sang trạng thái kế tiếp chỉ phụ thuộc vào trạng thái hiện tại, không phụ thuộc vào chuỗi các trạng thái trước đó. Tính chất “không có bộ nhớ” (memoryless) này giúp đơn giản hóa việc mô hình hóa các hệ thống phức tạp như mạng lưới truyền thông, chuỗi cung ứng, và hiện tượng trong sinh học hoặc tài chính.

Khả năng xây dựng dưới dạng chuỗi Markov rời rạc (discrete-time) hoặc liên tục (continuous-time) cho phép linh hoạt ứng dụng cho nhiều kịch bản: từ dự báo khí tượng, phân tích hành vi người dùng trên website, đến định giá quyền chọn tài chính. Mô hình Markov cung cấp khung để tính toán xác suất theo thời gian, từ ngắn hạn đến dài hạn, dựa trên ma trận chuyển tiếp hoặc ma trận tốc độ.

Đặc điểm chính của mô hình Markov là ma trận chuyển tiếp trạng thái và phân phối khởi đầu (initial distribution). Khi đã xác định được hai thành phần này, mọi bài toán về dự đoán phân phối trạng thái tại bước thứ k hoặc tính phân phối trạm dừng (steady-state) đều có thể giải quyết bằng các phép biến đổi ma trận cơ bản. Tính toán hiệu quả và khả năng mở rộng cao khiến Markov trở thành nền tảng cho nhiều mô hình chuyên sâu hơn như chuỗi ẩn Markov (Hidden Markov Model).

Định nghĩa và tính chất Markov

Cho chuỗi các biến ngẫu nhiên rời rạc thời gian {Xn, n = 0,1,2,…} có tập trạng thái hữu hạn hoặc đếm được S = {s1, s2, …}, mô hình Markov thỏa mãn tính chất:

  • Pr(Xn+1=jXn=i,Xn1=in1,,X0=i0)=Pr(Xn+1=jXn=i)\Pr(X_{n+1}=j \mid X_n=i, X_{n-1}=i_{n-1},\dots,X_0=i_0) = \Pr(X_{n+1}=j \mid X_n=i) cho mọi i, j ∈ S và mọi dãy i0,…,in−1.

Tính chất này được gọi là “Markov property” (đặc tính Markov) hay “memoryless property”. Trong mô hình rời rạc, phân phối trạng thái ban đầu được biểu diễn dưới dạng vector hàng π(0)\pi^{(0)}, với πi(0)=Pr(X0=si)\pi^{(0)}_i = \Pr(X_0 = s_i). Phân phối này cùng ma trận chuyển tiếp P định nghĩa hoàn toàn quá trình Markov.

Có thể mở rộng khái niệm sang không gian liên tục thời gian, ở đó ta dùng quá trình Markov liên tục với ma trận tốc độ Q và phương trình Kolmogorov. Tuy nhiên, nguyên lý cơ bản vẫn là xác suất chuyển đổi tại mỗi bước chỉ phụ thuộc vào trạng thái hiện thời.

Ma trận chuyển tiếp và tính toán xác suất

Ma trận chuyển tiếp P là ma trận kích thước |S|×|S| với phần tử pij = P(Xn+1 = sj | Xn = si). Mỗi hàng của P là một phân phối xác suất, nghĩa là:

  • pij0,jpij=1i.p_{ij} \ge 0, \quad \sum_{j} p_{ij} = 1\quad \forall i.

Phân phối trạng thái tại bước k được tính bởi:

  • π(k)=π(0)Pk.\pi^{(k)} = \pi^{(0)} \, P^k.

Ví dụ giả định chuỗi có ba trạng thái {A, B, C} với P như sau:

From \ ToABC
A0.60.30.1
B0.20.50.3
C0.10.40.5

Nếu π(0)=[1,0,0]\pi^{(0)} = [1,0,0] (bắt đầu ở A), thì phân phối tại bước 1 là π(1)=[1,0,0]P=[0.6,0.3,0.1]\pi^{(1)} = [1,0,0] P = [0.6,0.3,0.1]. Phép lũy thừa ma trận cho phép tính nhanh phân phối cho bất kỳ số bước k.

Phân loại trạng thái và tính liên thông

Mỗi trạng thái si trong chuỗi Markov có thể được phân loại dựa trên khả năng tái hồi và liên thông giữa các trạng thái:

  • Trạng thái hấp thụ (absorbing): pii = 1 và pij = 0 ∀ j ≠ i, khi vào sẽ không thoát.
  • Trạng thái tái sinh (recurrent): có xác suất 1 để quay về sau một thời điểm nào đó.
  • Trạng thái thoát (transient): có xác suất nhỏ hơn 1 để quay lại sau khi rời đi.

Lớp liên thông (communicating class) là tập trạng thái giữa đó có thể di chuyển lẫn nhau, tức nếu i và j cùng trong một lớp thì i → j và j → i. Chuỗi phân tách thành các lớp liên thông, giúp phân tích thành phần con độc lập.

Bảng tổng hợp đặc tính trạng thái:

Loại trạng tháiĐặc điểmỨng dụng ví dụ
Hấp thụKhông thoát; pii=1Mô hình hấp thụ́y tuyệt đối
Tái sinhXác suất quay lại =1Mô hình dịch bệnh có tuần hoàn
ThoátXác suất quay lại <1Mô hình ô tô hết nhiên liệu

Chuỗi Markov không chu kỳ (aperiodic) và liên thông (irreducible) đảm bảo tồn tại phân phối trạm dừng duy nhất, là nghiệm của phương trình π=πP\pi^* = \pi^* P.

Phân phối trạm dừng và cân bằng

Phân phối trạm dừng (steady–state distribution) π* là vector phân phối thỏa mãn phương trình π* = π* P, với điều kiện ∑_i π*_i = 1. Phân phối này mô tả xác suất chuỗi Markov ở trạng thái i khi quá trình đã tiến triển đủ lâu để đạt cân bằng, không phụ thuộc phân phối ban đầu.

Điều kiện tồn tại và duy nhất của π* đòi hỏi chuỗi Markov phải không chu kỳ (aperiodic) và liên thông (irreducible). Khi đó, lim_{k→∞} π^{(0)} P^k = π* với mọi π^{(0)}. Phân phối trạm dừng là công cụ quan trọng để dự đoán tần suất xuất hiện trạng thái trong dài hạn.

Bảng ví dụ với chuỗi ba trạng thái {A,B,C}, giả sử P có trạm dừng π* = [0.5, 0.3, 0.2]. Phân phối này cho biết sau thời gian dài, chuỗi có 50% thời gian ở A, 30% ở B và 20% ở C.

Trạng tháiπ* (ví dụ)
A0.50
B0.30
C0.20

Mô hình liên tục thời gian

Quá trình Markov liên tục thời gian (Continuous–Time Markov Chain, CTMC) mô tả sự kiện chuyển trạng thái xảy ra bất kỳ lúc nào. Thay vì ma trận chuyển tiếp P, CTMC sử dụng ma trận tốc độ Q, với q_{ij} ≥ 0 (i≠j) và q_{ii} = −∑_{j≠i} q_{ij}.

Phương trình Kolmogorov tiến hóa (forward equation) biểu diễn thay đổi ma trận xác suất P(t) theo thời gian:

dP(t)dt=P(t)Q\frac{dP(t)}{dt} = P(t)\,Q

Hệ phương trình này giải bằng ma trận mũ: P(t) = exp(Q t). CTMC ứng dụng trong mô hình hóa mạng truyền tin, sinh học phân tử (phản ứng hóa học ngẫu nhiên) và bảo hiểm (giá trị tổn thất theo thời gian).

Ước lượng và suy diễn tham số

Phương pháp cực đại (Maximum Likelihood Estimation – MLE) áp dụng cho chuỗi Markov rời rạc bằng cách đếm số lần chuyển i→j để ước tính p_{ij} = N_{ij}/∑_k N_{ik}, với N_{ij} là số lần quan sát chuyển từ i sang j.

Đối với chuỗi ẩn Markov (Hidden Markov Model – HMM), giải thuật Baum–Welch (EM algorithm) ước lượng đồng thời ma trận chuyển tiếp và phân phối phát xạ từ dữ liệu quan sát. Kết quả tối ưu hóa log-likelihood qua các bước lặp giữa Expectation và Maximization.

  • MLE cho chuỗi rời rạc: đơn giản, nhanh chóng khi dữ liệu đầy đủ.
  • Baum–Welch cho HMM: phức tạp, yêu cầu khởi tạo hợp lý và có thể dừng ở nghiệm địa phương.

Ứng dụng thực tiễn

Xử lý tín hiệu và nhận dạng giọng nói sử dụng HMM để mô hình hóa chuỗi âm vị trong lời nói, cho phép tách tiếng ồn và nhận dạng chính xác chuỗi phát âm (Coursera HMM).

Trong tài chính, Markov Chains được áp dụng để dự báo giá cổ phiếu dưới mô hình rời rạc, mô hình xếp hạng tín dụng và định giá quyền chọn với giả thiết biến động theo chuỗi Markov liên tục (Springer Finance).

Sinh học phân tử sử dụng CTMC để mô hình hóa sự thay thế nucleotide trong trình tự DNA, phân tích tiến hóa và xây dựng cây phát sinh loài. Mô hình Jukes–Cantor và Kimura là ví dụ điển hình của CTMC trong di truyền học.

Ưu điểm và hạn chế

Ưu điểm: mô hình Markov đơn giản, dễ tính toán, có lý thuyết cơ sở vững chắc; khả năng mở rộng sang HMM và CTMC cho nhiều ứng dụng phức tạp. Tính “memoryless” giúp giảm độ phức tạp khi mô tả các quá trình ngẫu nhiên.

Hạn chế: giả thiết Markov không phù hợp với các quá trình có phụ thuộc dài hạn; số lượng trạng thái lớn gây ra ma trận chuyển tiếp khổng lồ, khó ước lượng và tính toán. HMM dễ rơi vào nghiệm địa phương khi dùng EM, yêu cầu khởi tạo và điều chỉnh tham số cẩn thận.

Tiêu chíƯu điểmHạn chế
Đơn giản hóaMemoryless, dễ mô tảBỏ qua phụ thuộc dài hạn
Tính toánP^k & exp(Qt)Ma trận lớn khó xử lý
Mở rộngHMM, CTMCEM dễ kẹt nghiệm địa phương

Tài liệu tham khảo

  1. Grinstead, C. M., & Snell, J. L. (1997). Introduction to Probability. American Mathematical Society. Truy cập tại: https://math.dartmouth.edu/~prob/prob/prob.pdf.
  2. Norris, J. R. (1997). Markov Chains. Cambridge University Press.
  3. Rabiner, L. R. (1989). “A Tutorial on Hidden Markov Models and Selected Applications in Speech Recognition.” Proceedings of the IEEE, 77(2), 257–286.
  4. MIT OpenCourseWare. “18.445 Introduction to Stochastic Processes.” Truy cập tại: https://ocw.mit.edu/courses/18-445-introduction-to-stochastic-processes-spring-2014/.
  5. Stewart, W. J. (2009). Probability, Markov Chains, Queues, and Simulation. Princeton University Press.
  6. Coursera. “Hidden Markov Models.” Truy cập tại: https://www.coursera.org/lecture/ml-foundations/hidden-markov-models-BNdu0.

Các bài báo, nghiên cứu, công bố khoa học về chủ đề mô hình markov:

Các Biện Pháp Bayesian Cho Độ Phức Tạp và Độ Khớp Của Mô Hình Dịch bởi AI
Journal of the Royal Statistical Society. Series B: Statistical Methodology - Tập 64 Số 4 - Trang 583-639 - 2002
Tóm tắtChúng tôi xem xét vấn đề so sánh các mô hình phân cấp phức tạp trong đó số lượng tham số không được xác định rõ. Sử dụng lập luận thông tin lý thuyết, chúng tôi đưa ra một thước đo pD cho số lượng tham số hiệu quả trong một mô hình như sự khác biệt giữa trung bình hậu nghiệm của độ lệch và độ lệch tại giá trị trung bình hậu nghiệm của các tham số quan trọng....... hiện toàn bộ
#Mô hình phân cấp phức tạp #thông tin lý thuyết #số lượng tham số hiệu quả #độ lệch hậu nghiệm #phương sai hậu nghiệm #ma trận 'hat' #các họ số mũ #biện pháp đo lường Bayesian #biểu đồ chuẩn đoán #Markov chain Monte Carlo #tiêu chuẩn thông tin độ lệch.
Một mô hình Markov ẩn trong dự báo chỉ số chứng khoán VN-Index
Tạp chí tin học và điều khiển học - Tập 28 Số 3 - 2012
Phân tích và dự đoán thị trường cổ phiếu là một trong những lĩnh vực thúvị mà trong đó dữ liệu lịch sử có thể được sử dụng để ước tính và dự đoán dữliệu và thông tin của tương lai. Về mặt kỹ thuật mà nói, lĩnh vực này có tầmquan trọng lớn cho các chuyên gia trong tài chính và thị trường chứng khoánnhư là họ co thể nắm bắt và điều chỉnh xu hướng tương lai hoặc quản lý khủnghoảng theo thời gian. Tro...... hiện toàn bộ
PHÂN TÍCH CHI PHÍ – HIỆU QUẢ MỘT SỐ INSULIN ANALOG SỬ DỤNG TRONG ĐIỀU TRỊ ĐÁI THÁO ĐƯỜNG TÍP 2 TẠI VIỆT NAM DỰA TRÊN MÔ HÌNH MARKOV
Tạp chí Y học Việt Nam - Tập 504 Số 1 - 2021
Đặt vấn đề: Đái tháo đường (ĐTĐ) típ 2 đang là một vấn đề y tế công cộng lớn trên thế giới và tại Việt Nam, với tỉ lệ mắc bệnh cao và đang có xu hướng gia tăng, ảnh hưởng nặng nề tới kinh tế và sức khỏe của người bệnh và xã hội. Insulin analog tác dụng kéo dài là một phương án điều trị ĐTĐ típ 2. Tại Việt Nam, hai insulin analog tác dụng kéo dài phổ biến nhất là insulin glargine và detemir. Mục ti...... hiện toàn bộ
#Đái tháo đường típ 2 #insulin glargine #insulin detemir #chi phí – hiệu quả
XÂY DỰNG VÀ HIỆU CHỈNH CẤU TRÚC MÔ HÌNH ĐÁNH GIÁ CHI PHÍ – HIỆU QUẢ CỦA CHƯƠNG TRÌNH CAN THIỆP SỨC KHỎE TÂM THẦN VỊ THÀNH NIÊN TRONG TRƯỜNG HỌC TẠI VIỆT NAM
Tạp chí Y học Việt Nam - Tập 510 Số 2 - 2022
Mục tiêu: Xây dựng và hiệu chỉnh cấu trúc mô hình Markov để đánh giá chi phí – hiệu quả chương trình can thiệp sức khỏe tâm thần vị thành niên trong trường học tại Việt Nam. Phương pháp: Sử dụng tổng quan hệ thống, tổng quan tài liệu kết hợp với phỏng vấn sâuchuyên gia trong lĩnh vực sức khỏe tâm thần, kinh tế y tế, y tế và giáo dục (10 chuyên gia) và thảo luận nhóm (01 cuộc thảo luận nhóm). Kết q...... hiện toàn bộ
#đánh giá kinh tế y tế #mô hình hóa #mô hình markov #can thiệp dự phòng trầm cảm #can thiệp sức khỏe tâm thần
So sánh phương pháp nhận dạng hành động con người trong đoạn video quay bằng một camera dùng DTW và HMM
Tạp chí Khoa học và Công nghệ - Đại học Đà Nẵng - - Trang 64-68 - 2014
Trong bài báo này, chúng tôi tìm hiểu và so sánh hai thuật toán nhận dạng Dynamic Time Warping (DTW) và mô hình Markov ẩn HMM. Trước tiên, từ mỗi khung video, chúng tôi ước lượng tư thế người 3D, bao gồm tọa độ 3D của các khớp đặc trưng, dùng kỹ thuật mô hình hóa cơ thể 3D; rồi chuyển các tọa độ này sang thuộc tính quan hệ hình học GRF, mô tả quan hệ hình học giữa các khớp trong một tư thế nhằm gi...... hiện toàn bộ
#Dynamic Time Warping (DTW) #Nhận dạng hành động con người #mô hình hóa người 3D #thuộc tính quan hệ hình học #mô hình Markov ẩn tuần hoàn
Rủi ro sửa chữa trọn đời đối với thay khớp gối đơn bên trong thấp hơn dự đoán Dịch bởi AI
Wiley - Tập 28 - Trang 3935-3941 - 2020
Thay khớp gối đơn bên trong (UKR) được xem là một bước trước khi thay khớp gối toàn phần (TKR), đặc biệt ở những bệnh nhân trẻ. Điều này ngụ ý rằng việc thực hiện một ca UKR là hợp lý, mặc dù nó sẽ cần được sửa chữa tại một thời điểm nào đó, vì điều này sẽ hoãn lại nhu cầu cần phải thay khớp gối toàn phần. Trước đây, chưa có thống kê nào về khả năng sửa chữa một ca UKR trong suốt cuộc đời của bệnh...... hiện toàn bộ
#thay khớp gối đơn bên trong #rủi ro sửa chữa #thay khớp gối toàn phần #bệnh nhân trẻ #mô hình Markov
Tính toán phân phối rỗng tiệm cận của các bài kiểm tra độ phù hợp cho các mô hình đa trạng thái Dịch bởi AI
Springer Science and Business Media LLC - Tập 15 - Trang 519-533 - 2009
Chúng tôi phát triển một phương pháp xấp xỉ cải tiến cho phân phối rỗng tiệm cận của các bài kiểm tra độ phù hợp đối với các mô hình Markov đa trạng thái có quan sát theo bảng (Aguirre-Hernandez và Farewell, Stat Med 21:1899–1911, 2002) và các mô hình Markov tiềm ẩn (Titman và Sharples, Stat Med 27:2177–2195, 2008). Bằng cách xem xét phân phối chung của các số đếm chuyển tiếp quan sát được nhóm và...... hiện toàn bộ
#phân phối rỗng tiệm cận #kiểm tra độ phù hợp #mô hình Markov đa trạng thái #ước lượng độ tin cậy cực đại
Dự đoán suy thoái đồng cỏ ở đồng bằng Songnen phía tây nam bằng mô hình Markov hỗ trợ RS và GIS Dịch bởi AI
Geo-spatial Information Science - Tập 8 - Trang 104-109 - 2005
Bằng cách lấy thành phố Daan ở tỉnh Jilin làm đối tượng nghiên cứu và sử dụng hình ảnh TM vào năm 1989 và hình ảnh ETM+ vào năm 2001 từ vệ tinh LANDSAT của Mỹ, các loại bản đồ và tài liệu, thông tin về đồng cỏ, đất kiềm mặn, đất nông nghiệp, khu vực nước và rừng được trích xuất bằng phương pháp giải thích tương tác giữa người và máy với phần mềm GIS Arc View và ArcInfo, và dữ liệu thống kê được th...... hiện toàn bộ
#Suy thoái đồng cỏ #Mô hình Markov #GIS #RS #Đồng bằng Songnen #Hình ảnh LANDSAT
Các phương pháp từ chối trong nhận dạng câu viết tay Dịch bởi AI
Proceedings Eighth International Workshop on Frontiers in Handwriting Recognition - - Trang 24-29
Trong bài báo này, chúng tôi nghiên cứu việc sử dụng các thước đo độ tin cậy cho một hệ thống nhận dạng chữ viết tay trực tuyến. Chúng tôi điều tra các thước đo độ tin cậy khác nhau và sự tích hợp của chúng trong hệ thống nhận dạng từ đơn lẻ cũng như trong hệ thống nhận dạng câu. Trong các nhiệm vụ nhận dạng từ đơn, cơ chế từ chối được thiết kế để loại bỏ các kết quả của bộ nhận dạng có khả năng s...... hiện toàn bộ
#Nhận dạng chữ viết tay #Giải mã #Mô hình Markov ẩn #Mạng nơ-ron #Giao diện người dùng #Nhận dạng văn bản #Xử lý tín hiệu #Từ điển #Hội nghị
Tổng số: 70   
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7